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引 


周 老师 带 到 课堂 上 与 我 们 相遇 的 这 本 书 一 一 《Data-driven law: Data analytics 
and the New Legal Services》 《数据 驱动 法 律 . 数据 分 析 和 新 的 法 律 服务 》) ， 
是 对 数据 在 法 律 世界 中 与 法 律 的 各 种 互动 关系 的 呈现 与 研究 , 作为 典型 的 技术 与 
法 律 的 交叉 研究 , 该 书 以 及 该 课程 均 在 很 大 程度 上 打开 了 笔者 作为 纯 法 学 生 的 学 
术 和 专业 视野 ， 法 律 世 界 不 能 与 世 隔 绝 、 亭 然 独立 而 存在 ， 势 必需 要 与 现实 社会 
的 各 方 因素 形成 互动 与 联系 ,在 数字 化 、 大 数据 等 新 技术 快速 发 展 的 当下 ， 数 据 
成 为 无 可 避免 的 、 且 已 在 法 律 之 门 前 徘徊 数 久 的 热 络 门 客 , 数据 一 步 步 介 入 这 个 
沉闷 而 又 保守 的 法 律 世界 , 但 法 律 世界 又 将 如 何 接纳 他 ? 数据 将 在 法 律 世界 中 获 
得 何 种 角色 与 地 位 ? 数据 又 将 在 法 律 世界 发 挥 何 种 价值 ? 

到 底 是 相对 封闭 些 ， 坚 守 自 身 特 有 的 话语 模式 ， 还 是 适当 打开 自己 ， 接 受 其 
他 学 科 的 影响 ， 一 直 以 来 都 是 法 学 研究 时 不 时 面临 的 选择 。 比 如 ， 经 济 学 之 于 法 
学 、 社 会 学 之 于 法 学 、 政 治学 之 于 法 学 ， 等 等 。 本 篇 浅显 的 读 后 报 告 试 图 以 笔者 
从 本 书 中 获得 的 对 数据 的 了 解 出 发 ， 尝 试 对 二 者 关系 进行 进一步 探索 。 
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一 、 何 为 法 律 大 数据 


什么 是 大 数据 ? 有 一 本 英国 学 者 写 的 《大 数据 时 代 : 生活 、 工 作 与 思维 的 大 
变革 》， 从 中 大 概 得 知 何 为 大 数据 。 所 谓 大 数据 ， 有 三 个 特征 : 全 样本 、 混 杂 性 、 
相关 性 。 其中, 最 重要 的 就 是 全 样本 。 做 经 验 研 究 的 都 知道 ， 当 样本 等 于 总 体 时 ， 
抽样 误差 为 零 。 但是， 由 于 财力 、 人 力 、 分 析 技 术 等 条 件 的 限制 ， 人 们 很 难 拿 到 
全 样本 。 最早， 国家 为 了 知道 纳税 人 的 实际 情况 ， 就 发 展 出 各 种 消减 、 控 制 抽 样 
误差 的 统计 技术 。 而 现在 ， 随 着 计算 机 技术 的 发 展 ， 人 们 惊讶 地 发 现 ， 即 使 面 对 
海量 的 信息 ， 获 取 某 类 现象 的 全 样本 也 并 非 完全 不 可 能 。 基 于 这 种 全 样本 ， 人 们 
可 能 更 好 地 了 解 现实 社会 中 的 各 种 真实 。 于 是 , 根据 这 些 真实 去 预测 某 种 现象 的 
发 生 概率 , 就 更 可 靠 了 。 可 见 , 大 数据 并 不 在 于 样本 绝对 量 的 大 小 , 关键 在 于 “全 ” 


D] 。 


对 于 “什么 是 法 律 大 数据 ”， 法 律 界 目前 也 并 没有 统一 明确 的 说 法 。 套 用 维 
克 托 关于 大 数据 的 认识 ,我 们 不 妨 将 法 律 大 数据 理解 为 : 以 一 种 前 所 未 有 的 方式 ， 
通过 对 海量 法 律 数据 进行 分 析 , 对 法 律 问题 进行 预 判 , 获得 巨大 价值 的 产品 和 服 
务 , 或 得 出 新 的 认 知 、 深 刻 的 观点 和 主张 ， 法律 大 数据 可 能 改变 法 律 服务 市 场 及 
组 织 机 构 框 架 , 甚至 改变 政府 与 公民 的 关系 ,结合 课堂 上 与 周 老师 的 探讨 与 交流 ， 
法 律 大 数据 并 没有 一 个 明确 的 对 数据 内 容 或 范畴 的 边界 界定 , 法 律 大 数据 这 一 概 
念 最 终 可 能 成 为 法 律 人 的 一 种 新 的 思维 方式 , 通过 结合 数据 分 析 获 得 经 验 并 借 此 
认识 法 律 、 分 析 法 律 的 方法 论 。 


二 、 大 数据 对 法 律 世界 的 介入 

《一 ) 大 数据 对 法 学 研究 的 影响 

法 律 大 数据 的 出 现 ， 使 得 基于 法 律 大 数据 的 司法 实践 与 新 型 实证 研究 成 为 可 
能 ， 并 可 能 带 来 法 学 研究 方式 的 革命 性 变化 。 这 种 可 能 性 源 于 大 数据 所 具有 的 独 
特 优 势 : 数据 的 “全 样本 性 ”。 大 数据 通常 是 特定 领域 的 全 面 数据 ， 有 具有 数量 
大 与 内 容 全 面 之 特性 。 基 于 全 样本 数据 的 实证 研究 , 能 够 显著 减少 传统 抽样 方法 
可 能 导致 的 误差 , 增强 对 研究 对 象 的 整体 把 握 , 发 现 传 统 抽样 数据 中 难以 或 根本 
无 法 获取 的 信息 , 带 来 研究 视角 、 研究 素材 、 研 究 方法 的 根本 性 转变 。 数据 产生 、 
收集 、 分 析 的 快捷 性 。“ 数 据 分 析 的 速度 越 来 越 快 ,经常 在 数据 刚刚 证 进去 的 时 
候 就 可 以 看 到 实时 的 分 析 结 果 ”, 这 有 助 于 研究 者 及 时 有 效 地 掌握 相关 法 律 实践 
状况 的 全 貌 ， 从 而 克服 传统 实证 研究 方法 耗 时 、 滞 后 的 缺陷 。 数 据 收集 与 分 析 技 
术 的 客观 性 、 科 学 性 。 

与 具有 亲历 性 的 传统 手工 作坊 式 实证 研究 “大 多 是 自己 收集 、 整理 数据 *”“ 存 
在 因为 研究 动机 需要 而 选择 性 收集 、 运 用 数据 ”不 同 ,海量 材料 与 数据 远 非 “人 
工作 坊 时代 ” 研 究 者 所 能 亲自 、 逐 一 地 审阅 、 统 计 和 分 析 。 大 数据 的 收集 和 分 析 
往往 直接 依托 于 数据 技术 自动 处 理 、 完 成 。 在 开源 条 件 下 ,研究 过 程 具有 相当 的 
透明 度 ， 研究 结论 可 复 盘 检验 ， 数 据 收集 、 分 析 的 客观 性 、 科 学 性 明显 增强 。 特 
别 是 ， 利用 不 同 渠道 收集 的 数据 集 产生 了 海量 数据 ， 当 这 些 数据 聚合 到 一 起 ,可 
以 对 其 进行 挖掘 ， 并 开展 更 深层 次 的 分 析 ， 该 深度 分 析 能 揭示 出 各 种 模式 、 相 关 
关系 ， 并 进行 有 统计 意义 的 各 种 预测 。 这 不 仅 能 够 开展 历时 性 与 变迁 性 的 研究 ， 


mg 白 建 军 . 大 数据 对 法 学 研究 的 些许 影响 由 . 中 外 法 学 , 2015, 27(1):7. 


3 


也 能 够 进行 预测 性 研究 与 趋势 分 析 ， 最 终 促进 研究 科学 水 准 的 提升 。 

近年 来 ， 国 内 也 出 现 直 接 利 用 大 量 数据 展开 法 学 研究 的 探索 ， 并 已 经 注意 到 
法 律 大 数据 所 面临 的 伦理 规范 等 问题 。 其 中 , 有 学 者 就 如 何 开展 大 数据 法 律 研 究 ， 
提出 了 有 启发 性 的 见解 。 不 过 ， 国 内 的 大 数据 法 律 研究 整体 上 还 处 于 探索 阶段 ， 
一 些 研究 缺乏 对 法 律 大 数据 的 基本 认识 ， 研 究 方法 和 过 程 其 实 建立 在 某 些 误 识 
上 。 因 此 ,检视 大 数据 法 律 研究 现状 , 洪 清 若干 误 识 ， 对 于 大 数据 法 律 研究 的 健 
康 开 展 具 有 基础 性 意义 。 

(二 ) 大 数据 对 法 律 实践 的 影响 

己 经 有 诸多 研究 指出 ， 大 数据 分 析 在 推动 国家 治理 决策 和 提高 国家 治理 能 
方面 具有 积极 意义 ,特别 是 在 提供 公共 服务 方面 。 就 立法 活动 本 身 而 言 ， 大 数据 
也 可 以 提供 更 好 的 证 据 支 持 和 正当 性 证 明 , 特别 是 在 监管 立法 领域 (例如 食品 药 
品 、 生 产 和 环境 安全 等 数据 密集 型 领域 ) 。 传 统 的 立法 起 草 过 程 涉及 调查 、 听 证 、 
论证 、 征 集 意见 、 风 险 评估 等 方式 ， 其 目的 都 在 于 尽 可 能 多 地 获得 利益 相关 方 的 
想法 和 意见 。 基 于 海量 数据 的 分 析 可 以 使 立法 起 草 者 获得 更 加 准确 的 一 手数 据 ， 
从 而 避免 利益 相关 人 基于 自身 利益 而 对 立法 目标 进行 的 扭曲 或 忽视 , 成 为 科学 决 
策 的 有 力 补充 。 

大 数据 分 析 有 可 能 超越 了 原来 基于 国家 能 力 不 足 而 导致 的 事实 上 的 政府 与 
社会 和 私人 领域 的 边界 ， 从 而 要 求 在 法 律 上 重新 划 定 边界 ,并 限制 茶 些 分 析 和 预 
测 性 的 使 用 。 从 这 个 意义 上 讲 , 技术 上 的 精确 性 并 不 能 完全 取代 我 们 对 立法 原则 
和 目的 的 探求 ， 有 必要 就 精准 技术 带 的 权力 边界 扩张 和 后 果 进 行 评估 。 当 然 ,， 至 
少 是 在 目前 ,由 于 人 口 流动 和 城市 地 区 快速 发 展 变动 带 来 的 干扰 , 在 运用 信息 技 
术 加 强 社会 治安 防 控 体 系 建设 的 大 思路 下 , 一 些 城市 的 警方 还 只 能 根据 大 数据 进 
行 粗略 的 预测 。 例如， 北京 市 怀柔 区 警方 通过 运用 大 数据 、 云 计算 和 科学 分 析 模 
型 ,整合 历年 案件 信息 建立 了 犯罪 数据 分 析 和 趋势 预测 系统 ,能 够 自动 预测 犯罪 
趋势 ， 指 导 警 力 投 入 。 除 了 入 室 盗 鲫 、 诈 骗 、 抢 动 等 八 类 犯罪 外 ， 和 警方 还 将 系统 
言 轧 录入 范围 拓展 到 治安 案件 、 交 通 、 火 灾 事 故 ， 以 及 其 他 公共 管理 事件 ， 远 未 
到 针对 个 体 的 精细 治理 。 乌 但 可 以 预见 ， 随 着 数据 库 的 扩大 和 算法 的 改进 ， 大 数 
据 将 在 未 来 的 智慧 城市 治理 和 风险 预防 中 发 挥 越 来 越 大 的 作用 。 

目前 ， 中 国 利 用 大 数据 开展 的 法 律 实践 方兴未艾 。 例 如 : 基于 司法 公开 而 大 
力 推进 的 裁判 文书 上 网 工作 ; 依托 大 数据 技术 建立 犯罪 信息 判断 和 趋势 预测 ; 运 


D 左 卫 民 . 迈 向 大 数据 法 律 研 究 叮 .法 学 研究 ,2018,40(04):139-150. 
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用 大 数据 建设 “检察 大 数据 标准 体系 、 应 用 体系 、 管 理 体 系 、 科 技 支 撑 体 系 ”; 
利用 大 数据 建立 案件 权重 系数 和 评价 指标 体系 , 确定 法 官 工 作 量 , 并 进行 科学 的 
员额 分 配 、 案 件 分 流 ; 基于 大 数据 开展 的 多 种 法 律 人 工 智能 实践 ， 答 试 如 类 案 推 
荐 、 量 刑 辅助 与 偏离 预警 等 应 用 。 其 中 ,裁判 文书 大 规模 上 网 ， 使 得 中 国 第 一 次 
有 了 全 国 性 、 公 开 的 、 细 节 化 的 法 律 数 据 。 但 总 体 而 言 ， 目 前 国内 对 于 法 律 大 数 
据 的 实践 性 运用 还 相对 有 限 , 具体 运用 并 不 普遍 , 在 一 定 程度 上 呈现 出 “话语 热 、 
实践 冷 ” 的 现象 : 一 方面 ， 应 用 主体 范围 有 限 ， 主 要 集中 在 少数 司法 机 关 、 法 律 
数据 公司 ; 另 一 方面 , 应 用 领域 相对 较 窗 、 实 际 运用 较 少 , 主要 集中 在 类 案 检索 、 
法 律 文书 草拟 、 文 书 智能 纠 错 等 辅助 办 案 方 面 。 


三 、 大 数据 对 法 律 世界 的 冲击 与 挑战 

(一 ) 数据 安全 与 信息 保护 问题 一 一 对 个 人 隐私 的 挑战 

面 对 大 数据 时 代 对 包含 个 人 信息 的 数据 的 大 量 的 、 普 裔 的 采集 、 存 储 、 处 理 
和 流转 , 个 人 信息 保护 中 缠 含 的 人 格 利益 与 信息 自由 流通 和 应 用 中 总 含 的 巨大 经 
济 利益 、 公 共 安 全 和 公共 健康 等 公共 利益 之 间 形 成 了 巨大 的 张力 和 四。 这 种 矛盾 和 
利益 冲突 在 大 数据 时 代 将 被 进一步 激化 。 大 数据 产生 的 利益 应 该 如 何 分 配 ?” 大 数 
据 带 来 的 个 人 信息 被 滥用 的 隐患 应 该 如 何 规制 和 防 控 ? 面 对 利益 冲突 应 该 如 何 
设置 利益 平衡 点 ? 

(二 ) 算法 收视 与 “黑箱 ”问题 一 一 对 公平 正义 的 威 肋 

学 者 们 和 政府 愈 来 愈 意识 到 算法 上 收视 的 广泛 存在 ， 并 认为 这 些 新 型 收视 能 引 
发 一 系列 的 社会 问题 、 伦 理 问 题 和 法 律 问题 。 算法 自动 化 决策 为 人 们 带 来 方便 的 
同时 ,也 可 能 因 其 决策 过 程 的 不 透明 和 信息 不 对 称 而 对 某 些 群体 造成 收视 。 实 践 
中 ,算法 歧视 主要 表现 为 往 见 代理 的 算法 歧视 、 特 征 选择 的 算法 下 视 和 大 数据 杀 
熟 三 种 基本 形态 。Solon Barocas 和 Andrew D.Selbst 就 认为 ， 算 法 自动 化 决策 可 
能 给 某 些 群体 带 来 歧视 性 的 不 利 结果 。2014 年 ， 和 白宫 发 布 了 一 份 题 为 《大 数据 ; 
抓 住 机 遇 ， 保 护 价 值 》 (Podesta 等 ，2014) 的 报告 。 该 报告 认为 ， 受 数据 来 源 
的 特定 性 和 算法 设计 者 主观 意图 的 影响 ， 算 法 自动 化 决策 往往 会 对 申请 者 的 工 
作 、 教 育 或 信贷 构成 隐 性 偏见 。 这 种 结果 可 以 自我 强化 ， 从 而 系统 性 地 减少 个 人 
获得 信贷 、 就 业 和 教育 的 机 会 ， 这 会 使 他 们 的 处 境 恶 化 并 在 未 来 的 申请 中 处 于 不 


B] 张 吉 豫 . 大 数据 时 代 中 国 司法 面临 的 主要 挑战 与 机 遇 一 一 兼 论 大 数据 时 代 司 法 对 法 学 研究 及 人 才 塔 养 的 
需求 册 . 法 制 与 社会 发 展 ,2016,22(06):52-61. 


利 地 位 。 


四 、 结 论 


可 以 看 到 大 数据 开始 在 法 律 服务 和 法 学 研究 上 展现 其 影响 力 。 本 文 并 不 提倡 
一 种 数据 迷信 ， 大 数据 带 来 的 不 会 是 完全 革命 性 的 改变 , 而 只 是 对 决 集 提供 更 加 
精细 化 的 智力 支持 ， 使 决策 和 法 律 执行 更 有 效率 和 针对 性 。 

一 个 更 加 开放 的 问题 是 , 法律 的 未 来 是 否 会 被 无 尽 的 数据 和 算法 取代 ? 十 多 
年 前 就 有 人 提出 网 络 空间 中 “代码 就 是 法 律 ” 的 断言 。 在 大 数据 时 代 ， 数 据 及 其 
形 塑 数据 价值 的 算法 变 成 了 新 的 网 络 染 构 ， 在 貌似 客观 地 分 析 海 量 数据 的 同时 ， 
也 将 这 种 描述 性 的 遍历 性 事实 作为 一 种 规范 性 规则 施加 给 每 一 个 人 , 隐蔽 在 背后 
的 仍然 是 不 同 组 织 和 力量 试图 挖掘 数据 价值 的 计划 , 尤其 是 当 大 数据 被 广泛 应 用 
在 私人 交易 的 场合 。 更 进一步 ， 这 种 网 络 架 构 完 全 可 以 比 现 有 法 律 更 加 精细 ， 从 
而 超越 代 议 制 立法 机 关 提 出 新 的 规则 ， 而 不 受到 任何 制约 ; 当 算法 复杂 到 一 定 程 
度 而 无 法 被 人 直观 理解 ， 形 成 “黑箱 ”的 时 候 ， 这 将 是 危险 的 。 因 此 ， 大 数据 分 
析 的 预测 性 使 用 不 仅 不 应 当 取 代 现 有 法 律 ， 而 且 还 要 受到 民主 机 制 的 制约 和 监 
督 ， 即 受到 民主 立法 的 控制 。 法 律 不 同 于 技术 架构 的 要 点 在 于 它 既 是 社会 中 主流 
价值 观 的 反映 ,也 是 多 元 价值 和 利益 妥协 的 产物 ,但 数据 挖掘 只 服务 于 政治 或 商 
业 的 单一 利益 。 在 法 律 实践 和 研究 应 用 大 数据 的 过 程 中 , 我 们 应 当 注意 这 一 差别 ， 
从 而 尽 可 能 让 大 数据 服务 于 公共 利益 ， 更 好 地 贴近 法 律 实践 。 
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